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摘要 : 【目的 ] 为 机 构 知 识 库 与 数据 知识 库 建 立 政策 规范 进行 政策 调研 ， 为 图 书馆 员 推 荐 数据 知识 库 进 行 权益 分 
析 。[ 方法 ] 以 文献 综述 方法 ， 进 行政 策 调研 与 分 析 , 梳理 政策 要 素 及 其 内 容 。[ 结果 ] 研究 得 到 管理 者 的 权益 与 
义务 (建立 审核 机 制 、 制 定数 据 识别 标准 、 颁 布 传播 使 用 规定 ); 提交 者 的 权益 (免费 存储 、 更 新 元 数据 、 设 置 时 
滞 期 ) 与 义务 (保证 数据 来 源 可 靠 、 遵 守 知 识 库 政 策 、 避 免 知 识 产 权 争 议 ); 使 用 者 的 权益 与 义务 (免费 使 用 、 遵 循 
引用 规定 )。[ 局 限 】 缺乏 专业 型 数据 知识 库 政策 调研 ,未 来 可 以 建立 完整 的 政策 框架 。[ 结论 】 建 立 完善 的 数据 
知识 库 政策 ,在 平衡 各 方 利益 关系 的 基础 上 ,， 有 利于 推进 科研 数据 开放 共享 。 
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1 数据 知识 库 政策 是 科研 数据 开放 共享 的 策 的 重要 组 成 部 分 。 
核心 环节 


数据 已 成 为 科技 界 的 "一 等 公民 ”(First Class Citizen), 
过 去 仅仅 依赖 科研 论文 作为 学 术 评 价 的 方式 是 一 种 历 
史 局 限 罩 ,为 了 有 效 地 促进 科研 数据 开放 共享 , 科研 人 
员 逐 渐 形 成 了 较为 规范 的 数据 发 布 途径 和 数据 权益 贡 
献 体系 , 包括 : 利用 数据 知识 库存 储 与 发 布 科研 数据 ; 
利用 数据 期 刊 发 表 经 过 同行 评议 的 科研 数据 描述 符 咏 ; 
利用 学 术 期 刊 发 表 有 可 重复 验证 的 科研 数据 所 支撑 的 
学 术 论文 口 。 

三 者 之 间 的 具体 关系 如 图 1 所 示 四 ,由 此 可 知 , 科 , n "PW NT 
人 研 数据 知识 库 (Research Data Repository, RDR) 并 不 仅 SD A 
仅 是 一 个 科研 数据 开放 共享 的 基础 设施 , 更 是 整个 规 科学 研究 有 赖 相互 批评 、 相 互 成 长 、 相 互 借鉴 ; 在 
范 的 科研 数据 评价 体系 的 基石 。 数 据 知 识 库 的 研究 重 。 循环 与 动态 的 科学 研究 过 程 中 , 可 理解 的 科研 数据 成 
点 不 仅 是 信息 系统 建设 , 还 涉及 数据 质量 审核 与 数据 ”为 支持 科学 结论 检验 的 重要 依据 中。 科研 数据 既是 科 
贡献 评估 ,更 重要 的 是 作为 整体 科研 数据 发 布 规范 政 ”学 研究 的 结果 , 也 是 启发 进一步 科学 研究 的 宝 矿 中 


学 术 期 刊 


数据 集 的 元 数据 描述 
数据 质量 的 基本 控制 
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为 了 确保 科研 数据 和 相关 信息 的 可 获取 、 可 理解 和 可 
使 用 , 国家 政府 、 科 研 资 助 机 构 、 科 研 教育 机 构 、 科 
研 数据 中 心 、 科 研 人 员 、 图 书馆 员 和 数据 知识 库 管理 
员 等 都 发 挥 了 重要 的 贡献 号 相关 权益 分 析 逐 步 展 开 岂 ， 
科研 数据 开放 共享 的 基础 环境 正在 形成 中 。 科 研 数 据 
的 开放 共享 ,不 仅 需要 将 其 可 靠 存 储 ， 而 且 需 要 建立 
严谨 细致 的 科研 数据 溯源 管理 "1。 

由 于 国家 、 基 金 组 织 、 科 研 机 构 、 期 刊 等 对 支撑 
科研 成 果 的 科研 数据 提出 强制 性 存储 要 求 和 鼓励 性 建 
议 , 国际 上 建设 了 一 批 服务 于 科研 社 群 的 高 质量 数据 知 
HÆ, 如 : Edinburgh DataShare"?!, Open Data LMU'?!, 
PANGAEA"!"!. Dryad"?!. figsharel? , The Ber(li)n 
Digital Pantheon Project "^£, Jg T f DIPHA bi 4) 9E 
HARRER AE, 进而 存储 和 重用 其 科研 数 
据 , 数据 知识 库 注 册 与 目录 系统 应 运 而 生 ,， 主 要 有 
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OAD?! re3data.org! 等 , 它们 以 全 新 的 方式 对 数据 知 
识 库 的 相关 信息 进行 整合 、 链 接 和 呈现 中 |]。 

中 国 在 科研 数据 基础 设施 建设 与 研究 方面 已 取 
得 一 定 成 果 ， 如 科研 数据 共享 工程 请 、 地 球 系统 科研 
数据 共享 平台 1、 赛区 旱 区 科学 数据 中 心中 、 国 家 
人 口 与 健康 科研 数据 共享 平台 1、 国家 农业 科研 数据 
HEP IE, 这 些 数据 中 心 集中 于 大 数据 和 项 目 
数据 的 建设 , 目前 已 经 形成 一 套 科 学 数据 的 共享 体 
系 F ,但 对 于 通用 型 数据 知识 库 的 政策 研究 尚 处 起 
步 阶段 。 

数据 知识 库 , 因 其 自身 随 着 科学 技术 方式 和 环境 
的 变化 而 发 展 , 而 且 面 对 不 同 的 学 科 领 域 、 数 据 形 态 、 
应 用 层面 有 着 不 同 的 特点 和 分 类 中。 根据 前 期 调研 结 
ARP 在 本 文中 将 数据 知识 库 分 为 通用 型 和 专业 型 
两 大 类 ， 如 表 1 所 示 : 


— 


表 1 数据 知识 库 分 类 


类 型 英文 分 类 特点 


实例 面向 领域 


通用 型 数据 知识 库 General K esearch 多 学 科 Dryad 日 然 科学 、 工程 技术 x 
Data Repository figsharel*l 医学 、 人 文 和 社会 科学 
GenBankP"! 生物 医学 -DNA 序列 
PubChem?! 化 学 
NOAA National Climatic Data Center P?! 气象 学 

专业 型 数据 知识 库 cw qe 特定 学 科 SIMBAD Astronomical Database"?! 天 文学 
IQSS Dataverse Network"! 社会 科学 
Durham HepDataP?! 物理 学 
ORNL DAACP* 环境 与 地 球 科学 


2 数据 知识 库 的 政策 研究 


2.1 研究 提问 

数据 知识 库 不 仅 是 一 套 信息 系统 ,更 重要 的 是 作 
为 科研 数据 开放 共享 的 推进 器 。 因 此 , 传统 的 信息 系 
统 政策 调研 ,注重 “创建 -提交 -管理 -使 用 -保存 ”流程 
管理 的 内 容 ， 并 不 适用 于 数据 知识 库 调研 。 与 之 相反 ， 
如 果 从 “用 户 ” 和 “ 非 用 户 ” 的 角度 进行 “ 逆 思 考 ”， 即 为 
什么 有 的 数据 知识 库 得 以 获得 广大 科研 人 员 的 支持 ， 
有 的 数据 知识 库 则 难以 被 为 之 所 用 。 

本 研究 从 “利益 关系 人 ”的 角度 切 人 ,包括 科研 资 
助 者 、 科 研 管理 者 、 信 息 服 务 者 、 出 版 商 、 科 研 人 员 
等 角色 。 围 绕 数 据 知识 进行 简化 后 ,表明 数据 管理 者 
(数据 知识 库 本 身 的 管理 团队 和 经 验 团 队 )、 数 据 提交 


者 (愿意 贡献 科研 数据 的 科研 团队 或 者 个 人 )、 数 据 使 
用 者 (可 能 是 同一 批 或 者 不 同 的 科研 人 员 ) 等 三 方 角色 ， 
关系 着 数据 知识 库 是 否 得 以 有 效 运行 。 

鉴于 此 , 笔者 的 研究 提问 是 : 谁 (第 一 角色 ) 号 召 
着 谁 (第 二 角色 ) 存 储 数 据 并 且 规 定 谁 (第 三 角色 ) 如 何 
使 用 数据 。 笔 者 将 第 一 、 二 、 三 类 角色 所 关心 的 问题 
作为 本 文 的 研究 问题 ,总结 如 表 2 所 示 。 在 研究 问题 
下 的 政策 观测 问题 , 即 是 本 文 分 析 国 外 通用 型 数据 知 
识 库 政策 内 容 的 思路 。 
22 ”研究 对 象 

本 文 对 数据 知识 库 的 相关 政策 进行 研究 ， 以 
Dryad 数据 知识 库 有 关 条 款 为 主 以 figshare WH, 
系统 地 梳理 数据 存储 、 使 用 、 管 理 过 程 中 各 方 的 权益 
与 义务 , 归纳 总 结 国际 通用 型 数据 知识 库 的 政策 。 上 
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表 2 数据 知识 库 政策 的 分 析 框 架 

政策 观测 问题 
1、 如 何 引 导数 据 提交 者 有 效 提交 高 质量 的 数据 到 
, 数据 知识 库 中 ? 
2、 得 到 数据 后 ， 如 何 进行 标识 以 便 管理 ? 
3 、 标 识 后 的 数据 , 如 何 确保 数据 的 永久 可 使 用 性 ? 


研究 问题 


行 审查 ; 对 内 容 是 否 符合 文件 格式 和 最 低 报告 准则 进 
行 审查 , 并 在 发 现 内 容 不 符合 条 件 时 提醒 提交 者 或 出 

Q) 数据 知识 库 要 求 提交 者 的 数据 文件 是 可 被 打 
开 的 、 未 被 损坏 的 、 没 有 病毒 的 , 而 且 不 涉及 商业 利 


行 管理 ? 
4、 得 到 永久 可 用 可 查 的 数据 ， 如 何 规范 数据 使 用 
者 合理 使 用 数据 知识 库 中 的 数据 ? 

数据 提交 1、 提 交 者 对 数据 和 元 数据 的 存储 、 修 改 、 增 删 权利 


者 的 权利 “是 什么 ? 
义务 ? 2、 提 交 者 对 数据 本 身 有 怎样 的 
Meng 1、 使 用 者 可 否 免费 使 用 数据 ? 
义务 ? 2、 使 用 者 在 使 用 数据 时 需要 注意 什么 ? 
述 两 个 数据 库 中 , Dryad 由 一 个 非 鳃 利 组 织 管理 , 为 多 
种 多 样 的 数据 类 型 提供 一 个 通用 的 主页 ， 主要 存储 被 
际 数 据 知 识 库 接受 与 出 版 的 同行 评议 论文 的 相关 科 
研 数据 集 ， 且 不 限制 数据 格式 。figshare HAJS Digital 
Science 的 资助 ， 人 允许 用 户 上 传 诸如 图 片 、 数 据 集 、 多 
媒体 、 论 文 、 海 报 等 多 种 形式 的 文档 。 
2.3 ”研究 方法 

本 文 研究 设计 的 方法 参考 《前 脆 导 论 一 一 形 塑 未 
来 与 推动 政策 )n 所 提 到 “政策 内 容 采 集 ”到 “政策 建议 
提出 ”的 过 程 , 设置 观测 重点 。 在 研究 过 程 中 参考 《型 
人 导论 》 四 第 二 章 , 以 实用 主义 方法 论 的 四 大 原则 判 
断 具体 内 容 选 取 与 否 , 并 且 在 不 同 政策 内 容 中 ,以 合 
理 的 方法 筛选 能 够 解释 现 况 的 最 佳 选 择 方案 , 据 此 提 
炼 政 策 要 素 。 


3 ”科研 数据 知识 库 的 权益 管理 规范 


3.1 ”确保 科研 数据 服务 质量 的 审核 机 制 

(1) 数据 知识 库 对 发 布 的 数据 进行 审查 和 组 织 ， 
确保 文档 的 元 数据 是 规范 、 正 确 、 可 用 的 。Dryad 中 
大 部 分 是 经 过 同行 评审 的 数据 包 中 ，figshare 要 求 确 
保 所 提交 的 数据 中 不 包含 任何 个 人 信息 和 医疗 信息 ， 
并 且 不 违反 英国 《数据 保护 法 》(Data Protection Act, 
1998) (作为 一 家 公司 , 需要 遵守 注册 所 在 地 所 适用 
IERA, 

(2) 为 保证 提供 服务 的 质量 , 数据 知识 库 在 其 声 
明 中 说 明 可 能 会 进行 若干 审查 , 包括 个 1: 对 包含 个 人 
的 、 敏 感 的 或 不 合适 的 信息 进行 内 容 审查 ; 对 著作 权 
和 许可 声明 中 潜在 的 与 CC0 和 省 免 规定 相 冲突 的 内 容 进 


我 审核 义务 ? 
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益 及 其 可 能 存在 的 纠纷 。 
3.2 ”科研 数据 的 标识 规范 

(1) 清晰 说 明 数 据 来 源 。 数 据 知识 库 的 数据 来 源 
包括 多 种 形式 , 例如 实验 团队 产生 数据 ， 从 其 他 数据 
库 中 获取 的 数据 , 对 他 人 的 数据 经 过 整理 衍生 而 成 的 
数据 。 无 论 是 哪 种 数据 来 源 ， 都 需要 有 明确 说 明 。 

Q) 以 数字 资源 唯一 标识 符 (Digital Object Identi- 
fier, DOD 为 核心 的 标识 规范 。 

例如 , Dryad 中 每 个 数据 包 的 DOI 通常 为 : “http://dx. 
doi.org/10.5061/dryad.[:NNNNT^ XP, Er, “INNNN]” 
4 位 数字 为 数据 包 编 号 , 在 其 后 加 注 文件 的 版 本 信息 ， 
格式 为 %1”,%/2” 等 (“1* 前 的 数字 用 于 表示 该 数据 包 的 第 
儿 个 文件 )。 

当 新 版 本 文件 发 布 时 , 在 版 本 信息 后 加 注 更 新 信 
息 ， 如 “.2”“.3” 等 。 因 此 ， 如 文件 信息 :“http://dx.doi. 
org/10.5061/dryad.[NNNN].2/2.3”， 则 表示 此 文件 为 
"bttp://dx.doi.org/10.5061/dryad.[:NNNN] 数据 包 的 第 2 
个 文件 的 第 2 版 的 第 3 次 更 新 内 容 。 

而 figshare 中 每 个 数据 包 的 DOI 格 式 为 :“http:/dx. 
doi.org/10.6084/m9.figshre.|:NNNNNNN]["", figshare 3i 
从 DataCite 元 数据 标准 ,要求 用 户 对 文件 添加 如 下 
fim 9h 标题 (Title) 、 作 者 列表 (Authors) 、 类 别 
(Categories)、 标 签 (Tags) 和 一 份 对 该 文件 详细 的 解释 说 
明 (Description)。 同时 为 了 维护 研究 成 果 的 真实 性 和 持 
续 性 ,实行 版 本 控制 , 在 数据 页 面 提供 数据 更 新 标识 
(Retrieved)。 理 论 上 , 数据 更 新 后 DOI Wb EP, 
图 2 以 “All Hands to the Pump: Notes from NCCARF's 
2010 International Climate Adaptation Futures Con- 
ference” "数据 文件 为 例 进行 说 明 。 

3.3 ”科研 数据 的 长 期 保存 

出 于 长 期 保存 需要 ,进行 数据 迁移 中 数据 知识 
库 在 与 作者 签订 知识 产权 协议 的 基础 上 ,可 对 数据 内 
容 的 格式 进行 转换 , 确保 数据 在 所 占 容量 、 存 储 效率 
等 方面 便于 传播 和 再 利用 , 保证 对 数据 内 容 的 日 更 新 
频率 ， 及 时 将 提交 者 提交 的 内 容 存 储 到 远程 服务 器 以 


图 2 figshare 数据 呈现 内 容 


GÈ: 其 中 红色 圈 中 是 每 一 份 数 据 文件 必须 包含 的 信息 ,黄色 圈 
中 是 数据 更 新 的 呈现 。) 


及 长 期 保存 系统 中 。 男 外 Dryad 和 figshare 均 与 
CLOCKSS 呈 合作 保存 数据 内 容 的 副本 ,迁移 数据 格 
式 到 最 新 版 本 , 保证 数据 可 无 限期 访问 。 

3.4 ”科研 数据 的 传播 使 用 规范 

(1) 开放 获取 时 期 ,科研 数据 的 发 布 , 应 当 考 虑 各 
方 利 益 关 系 人 的 权益 ,确定 合理 的 时 滞 期 ,数据 知识 
库 可 以 提供 一 个 时 间 区 间 。 如 Dryad MEI i 
1-10 487, 

(2) 许可 协议 。 数 据 知 识 库 可 以 提供 明确 规定 或 
者 推荐 许可 协议 (如 元 数据 CCO, 数据 CC-BY 
等 )“ "9 中。 国际 上 通行 的 许可 协议 还 包括 : 开放 数据 
共享 公共 领域 贡献 及 许可 证 (PDDLD) 等 , 特别 强调 数据 
库 的 有 关 条 款 F0， 规 定 了 一 套 与 数据 库 相 关 的 社会 规 
范 , 如 开放 数据 共用 授权 社会 规范 等 5。 

Q) 允许 发 布 的 内 容 被 第 三 方 复制 或 索引 。 如 
Dryad 支持 与 数据 期 刊 论 文 和 特定 数据 知识 库 ( 如 
GenBank、DataONE 、TreeBASE) 数 据 相 互 关 联 。 

(4) 撤销 条 款 。 内 容 发 布 后 ,数据 知识 库 还 应 时 刻 
关注 其 使 用 情况 , 认真 记录 提交 者 和 用 户 提 出 的 问题 
及 撤销 公告 G1 例如 Dryad 认为 内 容 不 合适 时 (包括 敏 
感 的 、 侵 权 的 、 不 合法 的 资料 , 或 者 法 律 顾问 认为 其 
包含 对 Dryad 存在 风险 的 内 容 ) 有 权 决 定 暂 时 或 永久 
删除 该 内 容 。 在 对 内 容 的 元 数据 或 其 他 文档 记录 进行 
修改 和 整合 后 , 更 新 数据 文件 ， 并 与 出 版 商 勘误 表 进 
行 关 联 。( 有 的 期 刊 出 版 商 与 数据 知识 库 进 行 合作 , 共 
同 处 理 数据 发 布 的 问题 , 例如 PLoS 和 Dryad 等 多 个 数 
据 知 识 库 进行 合作 。) 
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4 科研 数据 提交 者 的 权益 管理 规范 


4.1 提交 者 权益 

(D 提交 者 享有 免费 存储 定量 数据 的 权益 ,超过 
该 容量 后 ， 需 提交 附加 的 数据 费用 。 为 鼓励 与 保障 数 
据 提交 工作 的 自觉 有 序 进行 , 知识 库 需 向 数据 提交 者 
提供 一 定 的 免费 存储 空间 。 如 Dryad 提供 10GBP"l, 
figshare 提供 1GB fije deze i 

(2) 提交 者 有 更 新 元 数据 的 权益 。Dryad 规定 中 
提交 者 可 以 更 新 已 发 布 数据 包 的 元 数据 ， 以 及 向 已 发 
布 数据 包 提交 新 的 或 更 新 的 文件 ， 且 无 需 缴纳 男 外 的 
数据 发 布 费 (仍然 可 能 需要 支付 附加 存储 费 ), 对 于 更 
新 的 文件 ,同时 要 保留 并 提供 获取 到 的 所 有 之 前 发 布 
的 版 本 ， 每 个 文件 将 被 赋予 一 个 唯一 标识 符 ， 且 数据 
包 的 元 数据 将 包括 关于 版 本 顺序 的 更 新 信息 。 在 
figshare 中 ,提交 者 可 以 更 新 类 目 、 标 签 和 描述 信息 ， 
但 这 些 并 不 构成 新 的 版 本 ， 只 有 对 标题 、 作 者 和 文件 
信息 进行 修改 时 才 形 成 新 的 数据 版 本 中 1。 

(3) 提交 者 有 权 设置 开放 时 滞 期 。 在 时 滞 期 内 , 数 
据 仅 供 项 目 和 课题 承担 单位 及 授权 范围 内 的 用 户 访问 
和 使 用 。 时 滞 期 过 后 ,可 向 社会 公众 全 面 或 分 批 次 开 
放 50。 在 实践 中 ,需要 注意 区 别 开 放 获取 时 滞 期 、 开 
放 时 期 和 最 低 保存 期 。 
42 ”提交 者 义务 

提交 者 一 方面 要 保证 数据 内 容 的 正确 性 、 合 法 性 ， 
另 一 方面 还 需 遵 守 知 识 库 的 相关 规定 。 具 体 包 含 以 下 


一 < 


(1) 数据 提交 者 必须 保证 是 内 容 的 作者 , 或 已 获 
得 内 容 作 者 的 授权 ,可 将 内 容 发 布 到 知识 库 , 保证 内 
容 的 正确 性 , 不 存在 虚假 或 误导 信息 。 

(2) 提交 者 在 提交 数据 内 容 的 同时 即 被 认为 知 
晓 并 遵守 数据 知识 库 的 许可 协议 , 并 允许 数据 知识 
库 依据 该 许可 协议 开放 其 数据 ,以 及 对 内 容 的 推 
广 与 宣传 、 格 式 转换 、 元 数据 修改 、 删 除 部 分 内 容 
等 操作 。 此 外 ， 提 交 者 在 遵守 数据 知识 库 有 关内 容 
发 布 的 许可 协议 时 需 保证 符合 出 版 商 、 资 助 机 构 、 
用 人 单位 等 的 相关 准则 与 合同 ,避免 可 能 引起 的 
z 纷 。 

(3) 提交 者 应 保证 提交 内 容 不 侵犯 知识 产权 、 个 
人 隐私 权 等 国家 的 相关 法 律 法 规 。 
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5 ”科研 数据 使 用 者 的 权益 管理 规范 


51 使 用 者 权益 

数据 使 用 者 在 遵循 开放 获取 的 前 提 下 ,可 以 免费 
使 用 科研 数据 ,例如 ,在 Dryad 政策 中 , 使 用 者 对 知识 
库 中 的 数据 内 容 享 有 免费 下 载 、 重 加 工 、 再 利用 以 及 
交流 等 多 项 权益 , 但 前 提 是 需 遵 循 知识 库 对 数据 内 容 
的 相关 许可 协议 。 科 学 数据 的 开放 共享 可 追溯 到 2010 
年 的 开放 科研 数据 原则 “ 潘 顿 原则 ”(Panton Principles), 
认为 开放 科研 数据 意味 着 允许 任何 用 户 以 任何 目的 免 
费 通 过 互联 网 对 数据 进行 下 载 、 复 制 、 分 析 和 再 利用 。 
同时 , 不 受 资金 、 法 律 或 其 他 技术 壁 牟 的 限制 *1。 目 
前 ,数据 知识 库 普遍 遵循 潘 顿 原则 。 
52 ”使 用 者 义务 

(1) 数据 知识 库 的 引用 规范 。 如 Dryad 要 求 用户 
采用 的 引用 格式 中 如 下 : 


<Creater>(<Publication Year>) Data from:<Title>. Dryad Digital 
Repository.<Identifier> 


如 图 3 所 示 , 在 该 引用 实例 中 ， 既 包括 原文 的 引 
用 信息 , 还 包括 Dryad 规定 的 对 数据 包 的 引用 信息 。 


Westbrook JW, Kitajima K, Burleigh JG, Kress WJ, Erickson DL, Wright 
SJ (2011) Data from: What makes a leaf tough? Patterns of correlated 


evolution between leaf toughness traits and demographic rates among 
197 shade-tolerant woody species in a neotropical forest. Dryad Digital 
Repository. http://dx.doi.org/10.5061/dryad.8525 


图 3 Dryad 知识 库 中 数据 内 容 引 用 格式 案例 中 1 


同 理 ，fighsare 在 其 每 一 份 数据 之 下 都 会 有 “Cite 
this” 的 标识 ,如 图 4 zs o: 


Share this: | Ei mare =- W Twet 10 8+4 1 


Lacovara, Kenneth (2014): Dreadnoughtus schrani 3D PDF images - Lacovara 


etal., 2014, A Gigantic, Exceptionally Complete Titanosaurian Sauropod 
Dinosaur from Southern Patagonia, Argentina, Scientific Reports,. figshare. 
http://dx.doi.org/10.6084/m9.figshare.1130885 

Retrieved 15:13, Oct 09, 2014 (GMT) 


图 4 figshare 知识 库 中 内 容 引 用 格式 案例 59 
Q) 除了 引用 ID 识别 码 外 , 也 可 以 对 存储 科研 数 
据 的 知识 库 网 址 进行 引用 。 如 ArrayExpress 功能 基因 组 
学 实验 数据 库 要 求 在 引用 数据 时 包含 数据 的 识别 符 和 
ArrayExpress 主页 网 址 中 1。 
(3) 耕 干 数据 知识 库 也 会 推荐 采用 DataCite 的 引 
用 格式 或 者 类 似 格 式 , 如 GEO(Gene Expression Omnibus) 


EB 现代 图 书 情报 技术 


研究 文 


建议 提交 者 引用 其 识别 符 (GSExxx), 同时 也 建议 用 户 
引用 他 人 的 原文 和 该 文章 所 对 应 数据 记录 的 识别 符 中 。 

(4) 在 使 用 数据 知识 库 时, 使 用 者 必须 遵守 数据 
知识 库 及 使 用 者 所 在 当地 的 国家 法 律 、 法 规 , 不 得 使 
用 非法 方式 ; 不 得 损害 其 他 使 用 者 的 权益 , 或 破坏 数 
据 知 识 库 的 功能 。 


6 结 语 


6.1 实践 意义 

基于 以 上 论述 , 笔者 提炼 数据 知识 库 的 政策 要 点 ， 
如 表 3 所 示 。 建 立 数据 知识 库 时 ,可 以 参考 此 表 进 行 
政策 规划 ; 图 书馆 员 推 荐 科研 人 员 存 储 科研 数据 时 ， 
也 可 利用 此 表 进 行 权 益 说 明 ; 机 构 知 识 库存 储 与 传播 
科研 数据 时 ,可 以 参照 此 表 进 行 有 关 的 政策 补充 条 款 
等 说 明 。 

表 3 通用 型 数据 知识 库 的 政策 要 素 
利益 相关 者 政策 要 素 

(1) 建立 审核 机 制 (元 数据 符合 规范 ; 保留 抽 
查 权利 ; 数据 的 可 使 用 性 ); 
(2) 制定 数据 识别 标准 (说 明 数 据 来 源 ; DOI 
及 其 标示 方式 ; 新 版 本 标示 方式 ); 
(3) 为 长 期 保存 的 数据 迁移 程序 ; 
(4) 颁布 传播 使 用 规定 (开放 获取 时 滞 期 ; 许 
可 协议 ; 允许 第 三 方 利用 ; 撤销 条 款 )。 
权益 : (1) 免费 存储 定量 数据 ; (2) 更 新 元 数 
Jg; (3) 设置 开放 获取 时 滞 期 。 
义务 : (1) 保证 数据 来 源 可 靠 ; (2) 遵守 知识 
库 政策 ; (3) 避免 知识 产权 争议 。 


权益 : 免费 使 用 数据 知识 库 中 的 数据 。 
义务 : 遵守 数据 知识 库 所 规范 的 引用 方式 。 


数据 知识 库 
管理 者 


数据 提交 者 


数据 使 用 者 


6.2. MRAR 

本 文 根 据 调 研 的 部 分 数据 知识 库 的 有 关 条 款 , JÉ 
成 系统 性 的 针对 通用 型 数据 知识 库 的 政策 框架 。 将 研 
究 结 论 进行 推广 时 , 需要 注意 各 国法 律 法 规 以 及 科研 
生态 体系 的 不 同 , 并 且 在 长 短期 资助 经 营 上 的 考虑 等 。 

例如 ，Dryad 对 其 存储 的 数据 内 容 与 元 数据 全 部 
实施 CC0 许可 协议 , 已 经 与 数据 提交 者 签署 知识 产权 
转让 协议 , 并 且 采 取 一 定 的 收费 形式 。 国 际 上 ， 有 些 数 
据 知 识 库 对 存储 的 元 数据 采用 CC0 协议 ， 而 对 数据 本 
身 采 用 CC-BY 或 者 其 他 许可 协议 。 

此 外 ,数据 知识 库 政策 能 否 照搬 到 机 构 知 识 库 还 
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是 需要 一 定 的 政策 调整 ,通用 型 数据 知识 库 面 向 的 是 
全 球 科 研 人 员 , 而 机 构 知 识 库 面 向 的 是 具有 专业 属性 
的 一 批 科研 人 员 或 者 教职员 工 。 无 论 是 Dryad 还 是 
figshare 等 数据 知识 库 , 均 保 证 了 一 定 的 存储 空间 , 但 
超过 这 个 空间 , 则 要 收费 。 一 方面 ,数据 与 论文 不 同 ， 
可 能 数据 集 需 要 不 断 追 加 存储 量 ; 另 一 方面 , 数据 存 
储 涉及 不 同 版 本 的 数据 集 ， 因 此 政策 中 ,往往 规定 作 
者 可 以 修改 元 数据 , 但 更 改 或 者 增 减 数据 ， 则 需要 通 
过 申请 或 者 额外 付费 等 。 不 仅 在 收费 问题 上 , 机 构 知 
识 库 的 立场 与 通用 型 数据 知识 库 不 同 , 而且 在 存储 内 
容 帮 至 管理 方式 上 也 有 所 不 同 , 这些 都 是 值得 注意 的 
政策 细节 之 处 。 
6.3 ”未 来 研究 

本 研究 针对 “通用 型 数据 知识 库 ” 进 行 调研 分 析 ， 
对 于 其 他 “专业 型 数据 知识 库 ” 还 需 进一步 研究 。 中 国 
科学 院 文献 情报 中 心 组 织 编译 了 《科研 数据 知识 库 的 
政策 汇编 》" 报 告 。 未 来 将 调研 我 国 科研 人 员 的 需求 ， 
以 及 我 国 数据 知识 库 优秀 实践 案例 , 形成 关于 数据 知 
识 库 政策 的 最 佳 实践 汇编 , 提供 更 为 具体 详尽 的 入选 
参考 范例 。 

(致谢 : 感谢 中 国 科学 院 计算 机 网 络 信息 中 心 刘 峰 老 师 
以 及 匿名 评审 老师 的 指导 意见 。) 
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Abstract: [Objective] Research and analyze the policy for establishing specification of Institutional Repository and 
Research Data Repository; explore related rights and obligations for recommending the data repository to librarians. 
[Methods] Summarize and refine policy elements through the literature review and Internet research. [Results] The 
results include rights and obligations of managers (establishing audit mechanism, making data identification standards, 
issuing regulations of spreading and using), rights of submitters (free storage, update metadata, set the embargo) and its 
obligations (ensuring reliable data source, abiding by the policy of data repository, avoiding the intellectual property 
rights disputes), rights and obligations of users (free of charge, follow the reference rules). [Limitations] Lack the 
policy research on Special Research Data Repository, thus the future study can establish a complete policy framework. 
[Conclusions] Establishing a complete policy of Research Data Repository, which can balance the interests of all 
parties and then promote the research data sharing. 
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